Splendeurs et misères des échecs Branquignols

Quelques analyses des parties Branquignols de mars 2020 à janvier 2021

Markov Erratique https://example.com/norajones (Branquignol Echecephile)https://www.cahiersdufootball.net/forum/le-fil-dont-vous-etes-le-heros-280?page=1405#3101976
2022-08-06

La Nalyses

Cette partie avait 2 coups

Berlin remplaçait londres, des fianchetto vengeurs prenaient les cases sombres, et chez les branquignols, débutants ou bien rois, le feu de caissa brillait de milles éclats

ahem.

Tout d’abord, regardons les ouvertures jouées par les branquignols. L’ouverture favorite des branquignols est sans surprise la sicilienne, avec 15% des parties. Beaucoup de Caro-Kahn et de “partie du pion dame” ainsi que des gambit dames refusés. L’espagnol par contre ne fait pas recette, totalisant moins de 3% des parties, loin derrière l’écossaise, l’italienne et la française. Enfin, j’ai regroupé toutes les ouvetures rarement jouées (<10 parties) dans la catégories “autres”. Au total, ces parties peu orthodoxes compte pour 11% des parties: le branquignol aime expérimenter!

season2
Avant Mai 21 Jan.-Juil 22  Juin-Dec 21 
         576          632          594 

Null null

En terme de résultat, on a très peu de nulles (~6%) et les même proportions de victoires avec blancs (48%) et noires (46%).

Si on regarde maintenant seulement les parties jouées entre joueurs appartenant à la même poule, on voit les mêmes tendances: l’avantage blanc n’est pas très marqué. Il n’y a que dans la poule 4 qu’on semble avoir un avantage blanc avec 60% de parties gagnées par les blancs.

Plutot Trezegoal ou Delvecchio?

On peut ensuite s’intéresser aux taux de conversions et de retournement. Pour celà, j’ai récupéré les évaluations de stockfish et j’ai repris la méthode de raspou, en considérant la première prise d’avantage importante dès qu’un joueur a obtenu une évaluation de +2 (évidemment c’est un seuil arbitraire, je renvoie aux explications de Raspou p1123 du forum pour les détails). Une fois qu’on a identifié le joueur qui a pris l’avantage en premier, on peut compter le pourcentage de fois ou le joueur qui menait la partie a gagné (“conversion” de son avantage) et le pourcentage de fois que la partie s’est retournée. Sur les 846 parties considérés ici, on un taux de conversion plutot haut, de 70% et un taux de retournement de 30%. Evidemment, ce taux est plus élevé dans la poule 1 (~80%) et diminue dans les poules de moins bon niveau jusqu’à ~60% dans la poule 5.

La complainte du progrès

Venons en à notre question principale: Est ce que nos joueurs branquignols ont progressé depuis le début de nos tournois?

Classement Elo

Commençons par regarder l’évolution des classements élos depuis mars 2022. J’ai regardé les élos en blitz, rapide et classique – je laisse le bullet de coté (car le bullet, est-ce vraiment des échecs?) Pour pouvoir regarder ce facteur de manière fiable, j’ai regardé la progression moyenne en Elo On ne peut pas mesurer de progression pour les parties longues comme on ne joue quasiment qu’entre nous, l’élo moyen reste stable. Pour corriger pour différents biais, on peut regarder la progression moyenne de l’élo des branquignols en rapide et en blitz. Aux deux cadences, on observe une progression moyenne de 150 points élo. Attention toutefois, les intervalles de confiances des progressions (la surface grisée qui entour les courbes) sont très large. On peut dire que la progression est entre 100 et 200 points élos. Autre élément qui peut biaiser les analyses: on a certains joueurs qui n’avaient pas joué depuis longtemps et chez qui la progression semble plutot être une mise à jour de leur élo pour qu’il corresponde à leur vrai niveau. L’ami Koller par exemple avait un élo blitz de 1460 en avril 2020 (2120 aujourd’hui!). J’ai fait ce que j’ai pu pour corriger ces biais (en enlevant les 30 premières parties, un peu comme fait lichess) mais pas dit que cela ait suffit.

[1] 40

Dans un second temps, on peut aussi regarder la progression moyenne dans chaque poule. Sans surprise, c’est dans les poules 4 et 5 que les progressions sont les plus fortes (+400 points de moyenne en rapide pour la poule 5, Bravo les gars!), mais on voit tout de même une notable progression des élos des joueurs de la poule 1.

Branquignol contre Branquignol

Bon c’est bien tout ça, mais c’est un peu frustrant de ne pas pouvoir savoir si la qualité des parties branquignols, (en cadence “classique”) a progressé depuis que l’on a commencé à jouer.

Pour cela, deux indicateurs: 1. le nombre moyen de centipions perdu par partie qui évalue (environ) la qualité de jeu d’une partie 2. le coup de la partie auquel un joueur a fait sa première bourde ( un coup à au moins -200 centipion). Plus la première bourde arrive tard dans la partie, plus on peut se dire que la partie a été de qualité. Pour une partie sans bourde, j’ai mis la valeure arbitraire de 50. Cette indicateur permet d’évaluer le niveau de préparation dans les ouvertures, et la capacité à faire de très bonnes parties (sans bourde).

Ces 2 indicateurs souffrent évidemment de nombreux biais, mais ils permettent de se faire une idée du niveau de jeu (notamment, pour l’indicateur des centipions, il faut mettre une valeure arbitraire quand l’évaluation donne “mat inévitable”).

J’ai divisé les parties en 3 périodes: “Avant mai 2021”, “de mai à décembre 2021” et “de janvier à juillet 2022”. il y a environ 300 parties par période, ce qui permet d’avoir un échantillon suffisant pour faire des stats. Dernier détail technique, j’ai dû exclure des cette analyse les joueurs qui nous ont rejoins trop récemment ou qui nous ont quitté en cours de route (Milan, classico, oGordinho, Kireg, …) car autrement cela introduit un nouveau biais.

Petit intermède stat/ représentation graphique: On représente les résultats avec un “boxplot” (ou boite à moustache): la ligne horizontal représente la médiane, les deux extrémités de la boite les 1er (25%) et 3e (75%) quantiles et les barres horizontales aux 2 extrémités les quantiles de 5 et 95%. (pour plus de précision: https://fr.wikipedia.org/wiki/Bo%C3%AEte_%C3%A0_moustaches). Ce genre de graphiques permet de comparer les médianes, tout en ayant une idée de la variabilité des scores dans chaque groupe. En effet, si l’on compare juste les médianes ou les moyennes, on peut avoir l’impression que les valeurs sont différentes dans les différents groupes, alors qu’en fait un a une trop forte variabilité pour pouvoir conclure qu’il y a une différence entre les groupes de parties (ici, les parties jouées aux différentes dates).

A première vu, on ne voit aucune différence entre les parties jouées au cours des 3 périodes, ni pour les centipions ni pour la première bourde. Le Branquignol n’aurait donc pas du tout progressé au cours de ces 2 années??

[1] 1570   24

Poule par poule

Cela dit, on peut imaginer que la progression n’est pas la même chez les joueurs expérimentés et chez les joueurs plus débutants. J’ai donc affecté à chaque joueur sa poule de la saison 4 (NB les compositions des poules sont fixes pour éviter que les changements de joueurs puissent affecter les résultats: les scores de Koller par exemple ont été affecté à la poule1 pour toutes les saisons).

On trouve alors des résultats différents en fonction des poules. Nos champions de la poule 1 restent fidèles à eux même, avec une perte mediane de 45 centipions par partie (note: ma méthode de calcul des centipions diffère un peu de ce que fait lichess). En poule 3 4 & 5 par contre, on voit une vrai tendance à la baisse: en poule 3 par exemple, on avait une médiane à 90 centipions perdues par partie avant mai 2021 et on tombe à 71 centipions perdus par partie en 2022. Seule la poule 2 ne semble pas progresser (voir même un peu régresser, de 60 à 70 centipions perdus par partie). Celà s’explique peut être par la progression des adversaires des poules inférieurs. Je vous fais grace des tests statistiques, mais les variations de la poule 1 et 2 ne sont pas significatives (cad qu’on ne peut pas exclure que les variations que l’on observe soient dues au hasard) tandis qu’on observe une diminution significative (la probabilité que la progression que l’on observe soit due au hasard est faible – ici <10%).

Pour la première bourde, on voit également une tendance à faire la première bourde de plus en plus tard dans la partie dans les poules 3 4 & 5 mais la progression est moins marquée et les différences ne sont pas statistiquement significatives, ce qui indique qu’on ne peut pas vraiment conclure à une progression suivant cette estimateur.

Op: 15 premiers coups Mid: coups 15 à 30 End: Après le 30e

Progression: 1: Plat partout 2: plat partout (légère régression en finale) 3: progres ouverture et milieu de jeu. Redressement de gros défauts en finale les premières saisons 4 plat partout et regresiosn en finale

5: Progression ouverture et milieu de jeu, mais pas top en finale

NULL

Les Jouors

(Pour afficher la courbe pour un joueur, il faut cliquer sur son nom sur le menu déroulant à droite – il y a aussi des petits bouton en haut à droite pour zoomer/ changer l’échelle) Petit bonus, j’ai tracé les courbes de progression pour chaque joueur. Je ne trouve pas les courbes supers informatives (certains paient leur mauvaise perf dans le suisse), à part pour les joueurs qui sont vraiment en forte progression (oGordinho et MrMeuble), mais c’est toujours rigolo de pouvoir regarder ses stats. Mais il faut se méfier, on peut voir des variations qui dépendent juste du niveau des adversaires rencontrés: Par exemple, quand on regarde la courbe de markov, on voit une nette augmentation autour de janvier/ juillet 2021, ce qui correspond à son passage en poule 1.


Call:
lm(formula = CentipLost ~ poule * seasonNum, data = GlobalStats)

Residuals:
     Min       1Q   Median       3Q      Max 
-101.767  -28.096   -6.017   20.601  200.325 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)        55.771      5.323  10.478  < 2e-16 ***
poule2             12.370      7.574   1.633 0.102585    
poule3             46.537      9.058   5.138 3.09e-07 ***
poule4             61.640      8.275   7.449 1.47e-13 ***
poule5             59.084     10.076   5.864 5.38e-09 ***
poule6             83.409     10.140   8.226 3.70e-16 ***
seasonNum          -2.381      2.579  -0.923 0.356006    
poule2:seasonNum    3.619      3.618   1.000 0.317371    
poule3:seasonNum   -5.292      4.114  -1.287 0.198414    
poule4:seasonNum   -1.566      3.846  -0.407 0.683829    
poule5:seasonNum   -4.315      4.605  -0.937 0.348882    
poule6:seasonNum  -16.038      4.492  -3.570 0.000366 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 41.85 on 1770 degrees of freedom
  (20 observations deleted due to missingness)
Multiple R-squared:  0.2161,    Adjusted R-squared:  0.2113 
F-statistic: 44.37 on 11 and 1770 DF,  p-value: < 2.2e-16

Call:
lm(formula = CentipLost ~ poule * seasonNum, data = GlobalStats)

Residuals:
     Min       1Q   Median       3Q      Max 
-101.767  -28.096   -6.017   20.601  200.325 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)        55.771      5.323  10.478  < 2e-16 ***
poule2             12.370      7.574   1.633 0.102585    
poule3             46.537      9.058   5.138 3.09e-07 ***
poule4             61.640      8.275   7.449 1.47e-13 ***
poule5             59.084     10.076   5.864 5.38e-09 ***
poule6             83.409     10.140   8.226 3.70e-16 ***
seasonNum          -2.381      2.579  -0.923 0.356006    
poule2:seasonNum    3.619      3.618   1.000 0.317371    
poule3:seasonNum   -5.292      4.114  -1.287 0.198414    
poule4:seasonNum   -1.566      3.846  -0.407 0.683829    
poule5:seasonNum   -4.315      4.605  -0.937 0.348882    
poule6:seasonNum  -16.038      4.492  -3.570 0.000366 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 41.85 on 1770 degrees of freedom
  (20 observations deleted due to missingness)
Multiple R-squared:  0.2161,    Adjusted R-squared:  0.2113 
F-statistic: 44.37 on 11 and 1770 DF,  p-value: < 2.2e-16

Call:
lm(formula = CentipLost ~ seasonNum, data = GlobalStats)

Residuals:
    Min      1Q  Median      3Q     Max 
-79.555 -34.009  -6.681  25.308 226.865 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   87.020      2.967  29.326   <2e-16 ***
seasonNum     -2.022      1.355  -1.492    0.136    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 47.07 on 1800 degrees of freedom
Multiple R-squared:  0.001235,  Adjusted R-squared:  0.0006801 
F-statistic: 2.226 on 1 and 1800 DF,  p-value: 0.1359

Call:
lm(formula = FirstBlund ~ poule * seasonNum, data = GlobalStatsSameLev)

Residuals:
    Min      1Q  Median      3Q     Max 
-22.745  -7.398  -3.005   4.300  36.371 

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)       27.23780    1.64047  16.604  < 2e-16 ***
poule2            -3.82631    2.35299  -1.626    0.104    
poule3           -14.80984    3.08628  -4.799 1.80e-06 ***
poule4           -13.98453    2.76757  -5.053 5.04e-07 ***
poule5           -13.67084    3.35779  -4.071 4.99e-05 ***
poule6           -12.65235    5.13961  -2.462    0.014 *  
seasonNum          0.50737    0.80457   0.631    0.528    
poule2:seasonNum  -1.17679    1.15116  -1.022    0.307    
poule3:seasonNum   1.75779    1.39633   1.259    0.208    
poule4:seasonNum  -0.13127    1.28625  -0.102    0.919    
poule5:seasonNum   0.06889    1.54989   0.044    0.965    
poule6:seasonNum  -0.14591    2.19277  -0.067    0.947    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.73 on 1178 degrees of freedom
Multiple R-squared:  0.1868,    Adjusted R-squared:  0.1793 
F-statistic: 24.61 on 11 and 1178 DF,  p-value: < 2.2e-16

Call:
lm(formula = FirstBlund ~ poule * seasonNum, data = GlobalStats)

Residuals:
    Min      1Q  Median      3Q     Max 
-24.013  -7.564  -3.193   3.997  36.675 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)       29.4443     1.4942  19.706  < 2e-16 ***
poule2            -5.5280     2.1261  -2.600   0.0094 ** 
poule3           -14.4467     2.5427  -5.682 1.56e-08 ***
poule4           -16.6930     2.3230  -7.186 9.80e-13 ***
poule5           -15.8154     2.8284  -5.592 2.60e-08 ***
poule6           -17.6567     2.8463  -6.203 6.86e-10 ***
seasonNum         -0.4312     0.7239  -0.596   0.5515    
poule2:seasonNum  -0.3167     1.0157  -0.312   0.7552    
poule3:seasonNum   1.7662     1.1548   1.529   0.1263    
poule4:seasonNum   1.0050     1.0795   0.931   0.3520    
poule5:seasonNum   1.3659     1.2928   1.057   0.2909    
poule6:seasonNum   2.2415     1.2610   1.778   0.0756 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 11.75 on 1770 degrees of freedom
  (20 observations deleted due to missingness)
Multiple R-squared:  0.1785,    Adjusted R-squared:  0.1734 
F-statistic: 34.97 on 11 and 1770 DF,  p-value: < 2.2e-16